Pengantar Analisis Statistik Inferensial

Capaian Pembelajaran

Setelah mempelajari bab ini, Anda diharapkan:

  1. mampu memilih jenis-jenis pengambilan sampel dalam statistik untuk sebuah kasus. STP-4.1
  2. mampu menjelaskan hasil perhitungan probabilitas dari suatu nilai sampel dalam distribusi statistik sampel menggunakan standard error. STP-4.2

Konsep Dasar Statistika Inferensial

Statistika inferensial adalah cabang statistika yang mempelajari penarikan kesimpulan tentang populasi berdasarkan data dari sampel. Konsep-konsep dasar yang perlu dipahami dalam analisis statistika ini meliputi perbedaan antara populasi dan sampel, teknik pengambilan sampel, distribusi sampel dan distribusi statistik sampel, serta prinsip-prinsip terkait distribusi statistik, yakni beberapa di antaranya adalah teorema limit sentral dan distribusi normal.

Setelah memahami konsep-konsep tersebut, kita dapat melanjutkan pembahasan ke penarikan kesimpulan karakteristik populasi dari hasil sampel, yang mencakup pembuatan estimasi parameter dan pengujian hipotesis yang menyatakan karakteristik seluruh populasi dari hasil sampel.

Populasi vs. Sampel

Populasi adalah seluruh kelompok objek (baik orang, benda, maupun kejadian) yang menjadi target penelitian kita. Ukuran statistik deskriptif dari populasi, seperti rata-rata (\(\mu\)) atau simpangan baku (\(\sigma\)), disebut parameter. Parameter inilah yang sebenarnya ingin diketahui oleh peneliti. Namun, karena jumlah populasi biasanya sangat besar, sering kali kita tidak mungkin mengukur seluruh anggota populasi secara langsung.

Sebaliknya, sampel adalah sebagian kecil dari populasi yang kita ambil untuk diamati. Sampel yang baik harus bisa mewakili sifat keseluruhan populasinya (representatif). Ukuran statistik deskriptif dari sampel inilah yang disebut statistik (seperti rata-rata \(\bar{x}\) atau simpangan baku \(s\)). Nilai statistik ini digunakan untuk menduga nilai parameter populasi.

Mengapa kita mengambil sampel? Alasan utamanya adalah efisiensi dan kelayakan. Menurut @saunders2023, melakukan sensus terhadap populasi yang besar sering kali tidak praktis karena membutuhkan biaya yang sangat mahal dan waktu yang lama. Selain itu, @devaus2014surveys menekankan bahwa sensus tidak menjamin data yang lebih akurat. Sebaliknya, sampel yang dipilih dengan hati-hati memungkinkan peneliti untuk mengontrol kualitas data dengan lebih ketat (misalnya melalui pelatihan pewawancara yang lebih intensif), sehingga justru dapat menghasilkan tingkat akurasi yang lebih tinggi dibandingkan sensus yang rentan terhadap non-sampling error.

Studi Kasus: Populasi vs. Sampel

Kita ingin menganalisis data karakteristik perjalanan mahasiswa di ITERA. Oleh karena itu, kita mengumpulkan data terstruktur yang mengukur variabel-variabel terkait pola perjalanan mahasiswa di ITERA.

Berdasarkan data tahun 2023 pertengahan, tercatat sebanyak 18.877 mahasiswa aktif di ITERA. Jika kita mengumpulkan seluruh mahasiswa aktif dengan jumlah tersebut, maka kita akan mendapatkan data populasi. Namun, karena jumlah mahasiswa yang sangat banyak, kita tidak mungkin mengumpulkan data seluruh mahasiswa aktif di ITERA. Oleh karena itu, kita mengumpulkan data sebagian mahasiswa aktif di ITERA, yaitu sebanyak 428 mahasiswa.

Ilustrasi Perbandingan Populasi Mahasiswa ITERA dan Sampel

Ilustrasi Perbandingan Populasi Mahasiswa ITERA dan Sampel

Keputusan mengambil 428 sampel ini didasarkan pada pertimbangan efisiensi dan akurasi yang telah kita bahas sebelumnya. Melakukan sensus terhadap 18.877 mahasiswa tentu membutuhkan biaya dan waktu yang sangat besar. Selain itu, dengan jumlah yang jauh lebih sedikit, peneliti dapat lebih fokus menjamin kualitas data (misalnya meminimalisir kesalahan input atau bias wawancara), sehingga data sampel ini diharapkan memiliki kualitas yang lebih baik daripada sensus yang dilakukan secara terburu-buru.

Teknik-Teknik Pengambilan Sampel (Sampling Techniques)

Teknik pengambilan sampel bertujuan memastikan bahwa sampel yang dipilih benar-benar dapat mewakili populasinya. @healey2021statistics menekankan prinsip EPSEM (Equal Probability of Selection Method), yakni prinsip yang menekankan bahwa setiap anggota populasi memiliki kesempatan yang sama untuk dipilih. Hal ini penting untuk menghasilkan sampel yang representatif.

Teknik probabilitas adalah teknik yang menggunakan prinsip EPSEM. Untuk dapat menggunakannya, kita harus memiliki kerangka sampel. Kerangka sampel adalah daftar seluruh anggota populasi yang akan menjadi acuan kita untuk memilih sampel nantinya. Ada empat jenis teknik yang termasuk ke dalam teknik pengambilan sampel probabilitas [@tjokropandojo2021pengantar, @saunders2023]: simple random sampling, systematic sampling, stratified sampling, dan multi-stage cluster sampling.

Studi Kasus: Pengambilan Sampel dengan Populasi Kecil

Untuk mempermudah pemahaman, bayangkan kita memiliki populasi kecil yang terdiri dari 16 orang saja. Setiap orang memiliki atribut Kelompok (A/B/C/D) dan tinggal di Blok tertentu (1/2/3/4).

Berikut adalah data lengkap ke-16 orang tersebut:

Daftar Lengkap Populasi (N=16)
ID Jarak Kelompok Blok ID Jarak Kelompok Blok
1 2.5 A Blok 1 9 10.5 A Blok 3
2 1.0 B Blok 1 10 11.2 B Blok 3
3 5.2 C Blok 1 11 9.8 C Blok 3
4 3.8 D Blok 1 12 8.5 D Blok 3
5 0.5 A Blok 2 13 15.0 A Blok 4
6 1.2 B Blok 2 14 14.2 B Blok 4
7 4.0 C Blok 2 15 16.5 C Blok 4
8 6.1 D Blok 2 16 13.8 D Blok 4

Mari kita terapkan keempat teknik sampling untuk memilih sampel dari 16 orang ini.

Simple Random Sampling

Simple random sampling merupakan teknik paling dasar dalam pengambilan sampel probabilistik. Kita mengambil secara acak nomor yang merepresentasikan nomor urut sampel. Ini memungkinkan setiap anggota populasi memiliki peluang yang sama untuk dipilih. Pemilihan anggota sampel secara acak ini dapat dilakukan dengan bantuan sistem eksternal dari peneliti, misalnya melalui tabel angka acak atau program komputer yang menghasilkan angka acak (random number generator) (Gambar @ref(fig:05-inferensia-img-srs)).

Ilustrasi Simple Random Sampling

Ilustrasi Simple Random Sampling

Catatan: Miskonsepsi tentang Istilah Random

Banyak yang salah kaprah dengan istilah random pada simple random sampling. Keacakan (random) di sini maksudnya bukan asal mengambil sampel secara acak langsung di dunia nyata, akan tetapi kita mengambil sampel tersebut dari sebuah kerangka sampel, elemen vital dalam teknik sampling probabilitas.

Studi Kasus: Simple Random Sampling dengan Populasi Kecil

Misalkan kita menggunakan random number generator yang ada di hampir semua program spreadsheet untuk memilih 4 sampel. Hasilnya adalah 4 orang yang terpilih secara acak tanpa pola tertentu.

Hasil SRS (n=4)
ID Jarak Kelompok Blok
9 10.5 A Blok 3
16 13.8 D Blok 4
14 14.2 B Blok 4
7 4.0 C Blok 2

Systematic Random Sampling

Berbeda dengan simple random sampling, systematic random sampling menggunakan sistem pemilihan berdasarkan interval tertentu. Langkah pertama adalah menentukan angka acak awal, kemudian memilih sampel berikutnya berdasarkan kelipatan dari angka tersebut.

Ilustrasi Systematic Random Sampling

Ilustrasi Systematic Random Sampling

Studi Kasus: Systematic Sampling dengan Populasi Kecil

Kita ingin mengambil sampel dengan interval k=4. Kita urutkan berdasarkan ID, lalu ambil setiap kelipatan 4 (4, 8, 12, 16).

Hasil Systematic Sampling (Interval k=4)
ID Jarak Kelompok Blok
4 3.8 D Blok 1
8 6.1 D Blok 2
12 8.5 D Blok 3
16 13.8 D Blok 4

Perhatikan pola ID yang terpilih selalu berjarak 4 angka.

Stratified Random Sampling

Dalam beberapa kasus, populasi terdiri atas kelompok-kelompok, disebut strata, yang memiliki karakteristik yang sama didalamnya, misalnya jumlah anggota rumah tangga, tingkat pendidikan, atau status sosial ekonomi. Agar setiap kelompok terwakili, digunakanlah teknik stratified random sampling. Caranya adalah dengan membagi populasi ke dalam beberapa strata sesuai karakteristik yang relevan, kemudian mengambil sampel secara proporsional dari setiap strata.

Ilustrasi Stratified Random Sampling

Ilustrasi Stratified Random Sampling

Studi Kasus: Stratified Random Sampling dengan Populasi Kecil

Kita ingin memastikan setiap Kelompok (A, B, C, D) terwakili. Kita bagi populasi menjadi 4 strata (Kelompok), lalu ambil 1 orang acak dari setiap strata.

Hasil Stratified Sampling (1 wakil per Kelompok)
ID Jarak Kelompok Blok
9 10.5 A Blok 3
6 1.2 B Blok 2
3 5.2 C Blok 1
16 13.8 D Blok 4

Hasilnya menjamin ada masing-masing satu perwakilan dari Kelompok A, B, C, dan D.

Multi-Stage Cluster Sampling

Teknik ini digunakan ketika kerangka sampel individu tidak tersedia, tetapi kerangka sampel untuk kelompok (klaster) tersedia. Misalnya, kita tidak punya daftar nama seluruh penduduk kota, tetapi kita punya daftar nama kecamatan dan kelurahan. Kita bisa memilih beberapa kelurahan secara acak (tahap 1), kemudian mendata seluruh penduduk di kelurahan terpilih tersebut. Teknik ini lebih hemat biaya dan tenaga untuk populasi yang tersebar luas, meskipun tingkat akurasinya (presisi) biasanya lebih rendah dibandingkan simple random sampling atau stratified sampling dengan ukuran sampel yang sama.

Ilustrasi Multi-Stage Cluster Sampling

Ilustrasi Multi-Stage Cluster Sampling

Studi Kasus: Multi-Stage Cluster Sampling dengan Populasi Kecil

Kita ingin menghemat tenaga dengan hanya mendatangi satu lokasi saja. Kita pilih secara acak 1 Blok (Cluster), lalu ambil semua orang di blok tersebut.

Hasil Cluster Sampling (Terpilih: Blok 4 )
ID Jarak Kelompok Blok
13 15.0 A Blok 4
14 14.2 B Blok 4
15 16.5 C Blok 4
16 13.8 D Blok 4

Kita hanya perlu mendatangi satu lokasi (Blok), tapi mendapatkan 4 responden sekaligus.

Konsep Distribusi dalam Statistik

Dalam stastistika inferensial, kita harus menguasai konsep mengenai distribusi. Distribusi adalah penyebaran suatu nilai yang memiliki karakteristik tertentu. Di sini, tujuan kita adalah mengenali apa yang kami akan sebut dengan distribusi objek dan distribusi statistik, atau yang dalam @healey2021statistics dan @ewing2020basic disebut distribusi sampel dan distribusi hasil sampel (sampling distribution).

Model-model Distribusi Statistik

Terdapat banyak jenis model distribusi dalam statistik yang sering dipakai. Beberapa jenis model statisik yang populer misalnya adalah distribusi uniform (seragam), distribusi binomial, distribusi Poisson, dan distribusi normal atau Gaussian [@ModernStatR-Home]. Namun, dalam pembahasan statistika inferensial di buku ini kita hanya akan fokus pada distribusi normal dan turunannya, distribusi Student’s t, beserta distribusi binomial, distribusi F, dan distribusi Chi-square.

Seperti yang ditampilkan oleh Gambar @ref(fig:fig-ragam-distribusi) berikut, setiap jenis distribusi statistik mempunyai berbagai bentuknya. Bentuk-bentuk ini pada hakikatnya adalah histogram-histogram representasi sebaran nilai-nilai sekumpulan objek.

Ragam Bentuk Distribusi Statistik

Ragam Bentuk Distribusi Statistik

Interpretasi Bentuk Distribusi

Seperti yang sudah dijelaskan bahwa bentuk distribusi sebenarnya adalah histogram, kita sudah belajar bahwa histogram memiliki 2 sumbu: sumbu X dan Y/mendatar dan tegak, yang masing-masing artinya adalah rentang nilai dan frekuensi kemunculan nilai tersebut secara berturut-turut.

Begitu juga gambar-gambar distribusi tersebut. Sumbu X mencerminkan nilai-nilai yang terdapat dalam objek-objek yang dinyatakan distribusinya, sumbu Y jumlah kemunculan nilai-nilai tersebut. Selain dipahami sebagai jumlah, sumbu Y juga bisa diinterpretasikan sebagai probabilitas kemunculan nilai-nilai tersebut.

Distribusi Normal

Distribusi normal adalah salah satu jenis distribusi nilai yang memiliki karakteristik berbentuk seperti lonceng, simetris, dan membentang tanpa batas di kedua sisi sumbu horizontal [@tjokropandojo2021pengantar]. Oleh karena itu, model distribusi ini juga disebut bell curve atau kurva lonceng [@healey2021statistics] (Gambar @ref(fig:fig-bab-5-hist-normal)).

Distribusi Normal

Distribusi Normal

Dari Gambar @ref(fig:fig-bab-5-hist-normal), kita dapat melihat bahwa distribusi normal memiliki beberapa karakteristik utama berikut:

  1. Parameter Utama: Distribusi normal ditentukan sepenuhnya oleh dua parameter: rata-rata (mean atau \(\mu\)) dan varians (\(\sigma^2\)) [@Chan-IntroProb]. Rata-rata menentukan lokasi tengah distribusi, sedangkan varians (atau standar deviasi) menentukan lebar atau penyebaran kurva [@healey2021statistics; @Hair-Multivariate].
Perbandingan Distribusi Normal dengan Rata-rata Sama namun Standar Deviasi Berbeda

Perbandingan Distribusi Normal dengan Rata-rata Sama namun Standar Deviasi Berbeda

  1. Simetri Sempurna: Pada distribusi normal yang sempurna, nilai mean (rata-rata), median (nilai tengah), dan mode (nilai yang paling sering muncul) adalah identik dan berada tepat di tengah distribusi [@healey2021statistics; @devaus2014surveys].

  2. Skewness dan Kurtosis:

  • Skewness (Kemencengan): Distribusi normal memiliki nilai skewness 0, yang menunjukkan simetri sempurna. Jika data menumpuk di kiri, itu disebut positive skew, dan jika di kanan disebut negative skew [@devaus2014surveys; @ewing2020basic].
Ilustrasi Positive dan Negative Skewness

Ilustrasi Positive dan Negative Skewness

  • Kurtosis (Keruncingan): Mengukur keruncingan atau kedataran puncak distribusi. Distribusi normal memiliki nilai kurtosis 3 (atau excess kurtosis 0). Distribusi yang lebih runcing disebut leptokurtik (nilai positif), dan yang lebih datar disebut platikurtik (nilai negatif) [@Chan-IntroProb; @ewing2020basic].
Perbandingan Kurtosis: Normal (0) vs Platikurtik (Negatif)

Perbandingan Kurtosis: Normal (0) vs Platikurtik (Negatif)

  1. Area di Bawah Kurva (Aturan 68-95-99, Aturan Empiris): Salah satu karakteristik paling berguna adalah proporsi area di bawah kurva yang tetap berdasarkan jarak standar deviasi (SD) dari rata-rata [@healey2021statistics]:

    • \(\pm\) 1 SD mencakup sekitar 68,26% dari total kasus.
    • \(\pm\) 2 SD mencakup sekitar 95,44% dari total kasus.
    • \(\pm\) 3 SD mencakup sekitar 99,72% dari total kasus.

    Ini mengimplikasikan bahwa kejadian yang berada jauh di luar 3 standar deviasi dari rata-rata sangat jarang terjadi.

Ilustrasi Aturan 68-95-99 (Aturan Empiris)

Ilustrasi Aturan 68-95-99 (Aturan Empiris)

Distribusi Objek dan Distribusi Statistik

Distribusi objek atau distribusi sampel merujuk pada sebaran nilai data dari objek-objek yang menjadi sampel yang kita ambil. Dengan kata lain, distribusi ini menggambarkan variasi data individual setiap objek.

Di sisi lain, distribusi statistik atau distribusi hasil sampel (sampling distribution) adalah distribusi nilai statistik (misalnya rata-rata) dari suatu populasi yang berasal dari perhitungan statistik sampel-sampel yang diambil berulang kali dari populasi tersebut. Statistik yang dihitung biasanya dapat berupa proporsi atau rata-rata.

Mari pelajari kasus berikut untuk lebih memahami perbedaan antara distribusi objek dengan distribusi statistik.

Studi Kasus: Distribusi Objek vs Distribusi Statistik

Agar lebih mudah membayangkan perbedaan antara distribusi objek dan distribusi statistik, mari kita gunakan populasi kecil yang hanya terdiri dari 30 mahasiswa (diambil dari data ITERA). Kita akan melihat variabel Jarak Tempuh (km).

1. Distribusi Objek (Sebaran Data Individu)

Berikut adalah data populasi lengkap (N=30):

Data Populasi (N=30)
ID Jarak ID Jarak
18 0.44 4 5.01
2 0.72 12 5.19
17 1.76 21 5.24
28 2.05 15 5.30
7 2.24 20 5.40
23 2.75 26 5.57
22 2.78 24 5.99
9 2.79 10 6.50
29 3.57 5 6.59
19 3.77 6 6.78
30 3.77 14 7.07
27 4.47 13 7.82
8 4.85 3 8.70
16 4.88 11 10.44
25 4.88 1 12.41

Rata-rata populasi adalah \(\mu = 4.99\) km dengan simpangan baku \(\sigma = 2.67\) km.

Sekarang, kita ambil 1 sampel berukuran \(n=10\) secara acak (Simple Random Sampling). Pengambilan menghasilkan sampel dengan ID 3, 9, 14, 17, 22, 23, 24, 25, 27, dan 30.

Histogram Distribusi Objek (n=10)

Histogram Distribusi Objek (n=10)

Pada histogram di atas, sumbu Y (“Frekuensi”) menunjukkan jumlah mahasiswa yang memiliki jarak tempuh tertentu. Variasi datanya menggambarkan seberapa berbeda jarak antar individu.

2. Distribusi Statistik (Sebaran Rata-rata)

Sekarang, kita lakukan simulasi: kita mengambil sampel (\(n=10\)) dari populasi tersebut sebanyak 200 kali. Setiap kali ambil, kita catat rata-ratanya.

Berikut adalah 8 hasil pertama dari 200 pengambilan sampel:

Hasil Simulasi Distribusi Sampling (8 Teratas dari 200)
Pengambilan_Ke Rata_Rata_Sampel
1 3.79
2 4.72
3 4.7
4 4.62
5 6.76
6 5.94
7 3.89
8 3.82

Mari kita lihat histogram dari 200 rata-rata ini:

Distribusi Statistik (200 Rata-rata)

Distribusi Statistik (200 Rata-rata)

Perhatikan perbedaan kedua histogram tersebut:

  1. Distribusi objek: Pada distribusi objek, sumbu Y mencerminkan “jumlah orang atau frekuensi objek yang memiliki nilai-nilai yang ada di sumbu X”. Misalnya, objek yang memiliki nilai di antara 2,5 sampai 4,0 ada 4 buah (ID 23, 22, 9, dan 30), sementara 4,0 sampai 6,0 ada 2 objek (ID 27 dan 25).

  2. Distribusi statistik: Pada distribusi statistik, sumbu Y mencerminkan frekuensi 10 sampel terambil (berapa kali kita mendapatkan rata-rata tersebut dari 200 percobaan).

Teorema Limit Sentral

Teorema Limit Sentral (CLT) menyatakan bahwa apabila ukuran sampel (\(n\)) cukup besar (biasanya \(n \ge 30\)), maka distribusi statistik sampel (sebaran rata-rata sampel) akan mendekati distribusi normal, terlepas dari bentuk distribusi populasi asalnya. Hal ini memungkinkan kita menggunakan statistik parametrik.

Studi Kasus: Simulasi Teorema Limit Sentral

Mari kita buktikan CLT dengan melakukan simulasi. Karena simulasi ini membutuhkan pengambilan sampel berulang yang banyak, kita akan kembali menggunakan data 428 mahasiswa yang telah kita miliki sebelumnya sebagai populasi. Kita akan mengambil 1000 kali sampel (masing-masing \(n=30\)), lalu menghitung rata-ratanya dan memplot histogramnya.

Perbandingan Distribusi Populasi (Kiri) dan Distribusi Sampling (Kanan)

Perbandingan Distribusi Populasi (Kiri) dan Distribusi Sampling (Kanan)

Perhatikan gambar di atas. Distribusi populasi (kiri) terlihat “miring” (skewed) ke kanan, artinya tidak normal. Namun, distribusi rata-rata sampelnya (kanan) berbentuk lonceng simetris yang hampir sempurna normal. Rata-rata dari distribusi sampling ini juga sangat dekat dengan rata-rata populasi sebenarnya (\(\mu = 5.01\)).

Standard Error (SE)

Standard Error adalah simpangan baku dari distribusi statistik sampel. Ini mengukur seberapa akurat rata-rata sampel kita sebagai estimator rata-rata populasi. Semakin kecil SE, semakin presisi estimasi kita.

\[ SE = \frac{\sigma}{\sqrt{n}} \]

Di mana \(\sigma\) adalah simpangan baku populasi dan \(n\) adalah ukuran sampel. Jika \(\sigma\) tidak diketahui, kita gunakan simpangan baku sampel (\(s\)) sebagai estimasi.

Studi Kasus: Menghitung Standard Error

Misalkan kita mengambil satu sampel acak berukuran \(n=100\) mahasiswa dari populasi.

Dari sampel ini, kita peroleh rata-rata jarak \(\bar{x} = 5.16\) km. Kita tahu simpangan baku populasi \(\sigma = 2.82\). Maka Standard Error teoritisnya adalah:

\[ SE = \frac{2.82}{\sqrt{100}} = 0.2817 \]

Nilai ini memberitahu kita bahwa rata-rata sampel kita (5.16) diperkirakan menyimpang sekitar \(\pm 0.28\) km dari rata-rata populasi sebenarnya.

Nilai Standar (Z-Score) dalam Inferensi

Z-score menunjukkan posisi suatu nilai dalam distribusi normal baku. Untuk rata-rata sampel, rumusnya menggunakan SE sebagai pembagi (bukan simpangan baku biasa):

\[ Z = \frac{\bar{x} - \mu}{SE} \]

Z-score ini kemudian dapat dikonversi menjadi probabilitas (P-value) untuk menentukan seberapa “wajar” atau “langka” sampel yang kita dapatkan.

Studi Kasus: Menghitung Z-Score dan Peluang

Apakah rata-rata sampel kita sebesar 5.16 km itu wajar? Mari hitung Z-score nya.

\[ Z = \frac{5.16 - 5.01}{0.2817} \]

Hasil: - Z-score = 0.54 - Probabilitas (\(P(Z < z)\)) = 0.7057

Artinya, peluang mendapatkan sampel dengan rata-rata 5.16 km atau lebih kecil dari populasi ini adalah sekitar 70.6%. Angka ini cukup besar (jauh dari 5% atau 0.05), sehingga sampel kita dianggap masih wajar dan berasal dari populasi tersebut.

Soal Evaluasi 5

  1. Studi Kasus Survei Keakraban. STP-4.1 Sebuah acara keakraban angkatan Anda akan dilakukan di suatu tempat yang memerlukan biaya sewa tempat. Agar acara Anda dihadiri sebanyak mungkin orang, Anda menanyakan kesediaan kawan-kawan Anda. Anda pun merancang sebuah survei untuk mengetahui persentase kawan Anda yang setuju acara keakraban diadakan di tempat tersebut. Untuk itu Anda menanyakan sebagian kawan Anda sebagai sampel.

    1. Apabila Anda memiliki daftar nama seluruh kawan Anda, apa nama teknik pengambilan sampel yang Anda bisa lakukan?
    2. Jelaskan bagaimana metode Anda memilih sampel kawan Anda berdasarkan kondisi di soal ke-1 tersebut.
    3. Apabila Anda tidak memiliki daftar nama seluruh kawan Anda, apa nama teknik pengambilan sampel yang Anda bisa lakukan?
    4. Jelaskan bagaimana metode Anda memilih sampel kawan Anda berdasarkan kondisi di soal ke-3 tersebut.
  2. Jelaskan perbedaan antara simpangan baku (standard deviation) dengan standard error! STP-4.2

  3. Kasus Jarak Tempat Tinggal. STP-4.2 Suatu sampel pegawai ITERA berjumlah 286 orang yang mengukur jarak tempat tinggal mereka ke kampus menghasilkan rata-rata 7,90 km dan simpangan baku 6,42 km.

    1. Jelaskan perbedaan distribusi sampel dengan distribusi statistik sampel menggunakan kasus ini.
    2. Apakah kita dapat menggunakan teorema limit sentral dalam perhitungan probabilitas distribusi statistik sampel kita tersebut? Jelaskan jawaban Anda.
    3. Katakanlah parameternya (rata-rata jarak tempat tinggal seluruh pegawai ITERA) diketahui sebesar 7,5 km, Hitunglah nilai standar (z-score) sampel kita.
    4. Hitunglah probabilitas kita mendapatkan nilai rata-rata seperti yang ditanyakan dalam 3.c tersebut dan jelaskan maknanya.